“草莓”现真身
9月13日,OpenAl宣布其最新的模型OpenAl o1(内部代号“草莓大模型”)正式发布,主打推理能力,号称能解决比以往模型更难的科学、编程和数学问题。
- 推理能力大:OpenAI 表示,o1 模型在物理、化学和生物等学科的 challenging 基准测试中,表现与博士生相当
- 数学和编程能力: 在一项国际数学奥林匹克竞赛(IMO)的资格考试中,GPT-4o 的正确率只有 13%,而 o1 模型的正确率高达 83%!在 Codeforces 编程竞赛中,o1 模型的成绩也达到了前 89%!
之前的市场预期:
发布时间基本符合预期:
综合以上,OpenAI o1技术的关键词:【RL(Self-Play RL)强化学习】【思维链(CoT)】。
在此催化下,今日光模块&PCB大涨。
- o1模型数理化能力超预期:
o1数理化、编码领域能力出色。o1在国际数学奥林匹克竞赛(IMO)考试中得分83%,此前GPT-4o仅解决了13%的问题,且o1在Codeforces比赛中达到第89个百分位。应用领域来看,o1所增强的推理功能可用于医疗保健行业的细胞测序数据注释、物理学领域的量子光学数学公式生成等一些列科学、编码、数学领域。
o1-mini更经济、更快速。同系列模型中,o1-mini是一种更快捷、更便宜的推理模型,擅长编码,o1-mini比o1-preview便宜80%,适用于需要推理但不需要广泛世界知识的应用程序。
o1目前为早期版本。其功能性尚不及ChatGPT如浏览网页、分析上传的文件和图像。目前ChatGPT Plus和Team用户可在ChatGPT中手动选择o1-mini和o1-preview,下周ChatGPT Enterprice和Edu用户也可访问。在启动时,o1-preview 的每周速率限制为30条消息,o1-mini 的每周速率限制为50条消息。
- o1的亮点在于在尝试解决问题时会使用思维链(CoT),具备识别和纠正错误能力,在自我内部思考时间增加时,其能力也能得到提升。这不同于传统的Scaling Law(尺度定律),后者主要关注训练过程中的参数量、数据量和计算量。我们认为此次OpenAI o1系列的发布并不仅仅是新模型的亮相,而是为未来大模型的性能开辟了新路径。
英伟达的具身团队领导者 Jim Fan 直接在 X 上点评了这一事件的历史意义——模型不仅拥有训练时的 scaling law,还拥有推理层面的 scaling law,双曲线的共同增长,将突破之前大模型能力的提升瓶颈——意味着大幅提升了对算力需求持续性。
光模块边际变化,1和5的逻辑开始兑现。光博会及光模块专家重要更新:
1、昨日和今日meta分别奔赴光模块厂家F和XC看厂并下单(XYS时间不知),预计meta总订单规模130万只800G左右(大约30%硅光),在24Q4和25Q1执行完,价格没有下降,单模800美金,而且硅光价格没有下降。
2、1.6T光模块目前XC最为领先,且预计25年大概率均是硅光(提升毛利率),而且开始阶段份额预计很高。
3、目前看N客户25年Q1的800G订单环比并没有减少。
4、1.6T的dsp主要还是用博通的,100g的eml芯片目前非常紧缺时断时续,无源、MT插芯偶尔会缺货/电芯片目前还算稳定。
5、目前XC和G客户一起在研发全光交换机(CPO不用担心了)